12. 练习准备:预测生命长度
用线性回归预测预期寿命
在该实验室中,你将使用关于出生时的平均预期寿命以及全世界男性的平均BMI的数据。 数据来自Gapminder。
工作区
Notebook 将在课堂内打开。 但是,如果您想单独打开它,可以从 GitHub仓库 中克隆这些资料。
在这个实验中,导航到主分支,然后打开** Regression.ipynb 。 像往常一样,如果你需要任何提示,请随时打开 RegressionSolutions.ipynb **。
数据文件可以在文件夹中的 "bmi_and_life_expectancy.csv" 标签下找到。 它包括三列,包含以下数据:
- 国家(Country) - 该个体出生的国家。
- 预期寿命(Life expectancy ) - 该国人的平均预期寿命。
- ** BMI ** - 该国男性的平均BMI。
你需要完成以下每个步骤:
** 1. 加载数据**
- 数据位于名为“bmi_and_life_expectancy.csv”的文件中。
- 使用熊猫
read_csv
将数据加载到 dataframe 中。 - 将 dataframe 分配给变量
bmi_life_data
。
** 2. 建立一个线性回归模型**
- 使用scikit-learn的
线性回归
创建回归模型并将其分配给
bmi_life_model
。 - 将模型拟合到数据中。
3. 预测使用模型
- 使用BMI 21.07931预测并将其分配给变量
laos_life_exp
。